物体检测是计算机视觉系统中的一项关键任务,广泛应用于自动驾驶、医学成像、零售、安全、人脸识别、机器人等领域。如今,基于神经网络的模型用于定位和分类特定类别的物体实例。当不需要实时推理时,模型集成有助于获得更好的结果。在这项工作中,我们提出了一种组合物体检测模型预测的新方法:加权框融合。我们的算法利用所有提出的边界框的置信度得分来构建平均框。我们在多个数据集上测试了该方法,并在 Open Images 和 COCO 物体检测赛道的背景下对其进行了评估,在这些挑战中取得了最高成绩。Waymo Open Dataset 和 Lyft 自动驾驶汽车 3D 物体检测挑战赛的获胜团队成功应用了 3D 版本的框融合。源代码可在 https://github.com/ZFTurbo/Weighted-Boxes-Fusion 上公开获取。